智能论文笔记

Assessing the Fairness of AI Systems: AI Practitioners' Processes, Challenges, and Needs for Support

Michael Madaio , Lisa Egede , Hariharan Subramonyam , Jennifer Wortman Vaughan , Hanna Wallach

分类：人工智能

2021-12-10

已经开发出各种工具和实践来支持从业者识别，评估和减轻AI系统造成的公平相关危害。然而，现有研究突出了这些工具和实践的预期设计与特定背景下的使用之间的差距，包括由组织因素在塑造公平工作中发挥的作用引起的差距。在本文中，我们研究了一个这样的实践的这些差距：AI系统的分类评估，旨在揭示人口统计组之间的表现差异。通过在三个技术公司的十支队伍中进行半结构化访谈和三十三名艾尔从业人员，我们在设计分列的评估时，我们识别从业者的流程，挑战，并对支持的需求。我们发现从业者在选择绩效指标时面临挑战，识别最相关的直接利益相关者和在其上进行重点的人口统计集团，并收集其进行分类评估的数据集。更一般地说，我们识别对公平工作的影响，这些工作缺乏与直接利益相关者的订婚，优先考虑通过边缘化群体的客户，以及以规模部署AI系统的驱动器。

translated by 谷歌翻译

Image-to-Image Translation for Autonomous Driving from Coarsely-Aligned Image Pairs

Youya Xia , Josephine Monica , Wei-Lun Chao , Bharath Hariharan , Kilian Q Weinberger , Mark Campbell

分类：计算机视觉 | 机器人

2022-09-23

自动驾驶汽车必须能够可靠地处理不利的天气条件（例如，雪地）安全运行。在本文中，我们研究了以不利条件捕获的转动传感器输入（即图像）的想法，将其下游任务（例如，语义分割）可以达到高精度。先前的工作主要将其作为未配对的图像到图像翻译问题，因为缺乏在完全相同的相机姿势和语义布局下捕获的配对图像。虽然没有完美对准的图像，但可以轻松获得粗配上的图像。例如，许多人每天在好天气和不利的天气中驾驶相同的路线；因此，在近距离GPS位置捕获的图像可以形成一对。尽管来自重复遍历的数据不太可能捕获相同的前景对象，但我们认为它们提供了丰富的上下文信息来监督图像翻译模型。为此，我们提出了一个新颖的训练目标，利用了粗糙的图像对。我们表明，我们与一致的训练方案可提高更好的图像翻译质量和改进的下游任务，例如语义分割，单眼深度估计和视觉定位。

translated by 谷歌翻译

Multi Robot Collision Avoidance by Learning Whom to Communicate

Senthil Hariharan Arul , Amrit Singh Bedi , Dinesh Manocha

分类：机器人

2022-09-14

分散的多代理导航的代理缺乏世界知识，无法可靠地制定安全和（接近）最佳计划。他们将决定基于邻居的可观察状态，这隐藏了邻居的导航意图。我们提出了通过机构间沟通的增强分散导航，以提高其绩效和援助代理，以做出合理的导航决策。在这方面，我们提出了一种新颖的增强学习方法，用于使用选择性间隔沟通来避免多代理碰撞。我们的网络学会决定“何时”并与“谁”交流，以端到端的方式索取其他信息。我们将沟通选择作为链接预测问题，在该问题中，如果可以观察到的信息，网络可以预测是否需要通信。传达的信息增加了观察到的邻居信息以选择合适的导航计划。随着机器人的邻居数量的变化，我们使用多头自发项机制来编码邻居信息并创建固定长度的观察向量。我们验证我们提出的方法在挑战模拟基准中实现了多个机器人之间的安全有效导航。通过学习的通信，我们的网络的性能比在各种指标（例如到目标和碰撞频率）中的现有分散方法的表现要好得多。此外，我们展示了网络有效地学会在高复杂性情况下进行必要时进行交流。

translated by 谷歌翻译

DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments

Aakriti Agrawal , Senthil Hariharan , Amrit Singh Bedi , Dinesh Manocha

分类：机器人 | 机器学习

2022-09-07

我们为仓库环境中的移动机器人提供基于新颖的强化学习（RL）任务分配和分散的导航算法。我们的方法是针对各种机器人执行各种接送和交付任务的场景而设计的。我们考虑了联合分散任务分配和导航的问题，并提出了解决该问题的两层方法。在更高级别，我们通过根据马尔可夫决策过程制定任务并选择适当的奖励来最大程度地减少总旅行延迟（TTD）来解决任务分配。在较低级别，我们使用基于ORCA的分散导航方案，使每个机器人能够独立执行这些任务，并避免与其他机器人和动态障碍物发生碰撞。我们通过定义较高级别的奖励作为低级导航算法的反馈来结合这些下层和上层。我们在复杂的仓库布局中进行了广泛的评估，并具有大量代理商，并根据近视拾取距离距离最小化和基于遗憾的任务选择，突出了对最先进算法的好处。我们观察到任务完成时间的改善高达14％，并且在计算机器人的无碰撞轨迹方面提高了40％。

translated by 谷歌翻译

Ithaca365: Dataset and Driving Perception under Repeated and Challenging Weather Conditions

Carlos A. Diaz-Ruiz , Youya Xia , Yurong You , Jose Nino , Junan Chen , Josephine Monica , Xiangyu Chen , Katie Luo , Yan Wang , Marc Emond

分类：计算机视觉

2022-08-01

由于大规模数据集的可用性，通常在特定位置和良好的天气条件下收集的大规模数据集，近年来，自动驾驶汽车的感知进展已加速。然而，为了达到高安全要求，这些感知系统必须在包括雪和雨在内的各种天气条件下进行稳健运行。在本文中，我们提出了一个新数据集，以通过新颖的数据收集过程启用强大的自动驾驶 - 在不同场景（Urban，Highway，乡村，校园），天气，雪，雨，阳光下，沿着15公里的路线反复记录数据），时间（白天/晚上）以及交通状况（行人，骑自行车的人和汽车）。该数据集包括来自摄像机和激光雷达传感器的图像和点云，以及高精度GPS/ins以在跨路线上建立对应关系。该数据集包括使用Amodal掩码捕获部分遮挡和3D边界框的道路和对象注释。我们通过分析基准在道路和对象，深度估计和3D对象检测中的性能来证明该数据集的独特性。重复的路线为对象发现，持续学习和异常检测打开了新的研究方向。链接到ITHACA365：https：//ithaca365.mae.cornell.edu/

translated by 谷歌翻译

Diagnosing and Remedying Shot Sensitivity with Cosine Few-Shot Learners

Davis Wertheimer , Luming Tang , Bharath Hariharan

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-07

很少的识别涉及训练图像分类器，以使用几个示例（Shot）在测试时间区分新颖概念。现有方法通常假定测试时间的射击号是事先知道的。这是不现实的，当火车和测试射击不匹配时，流行和基础方法的性能已被证明会受到影响。我们对该现象进行了系统的经验研究。与先前的工作一致，我们发现射击灵敏度在基于度量的几个学习者中广泛存在，但是与先前的工作相反，较大的神经体系结构为变化的测试拍摄提供了一定程度的内置鲁棒性。更重要的是，通过消除对样品噪声的敏感性，一种基于余弦距离的简单，以前已知但非常忽略了一类方法，可以极大地改善对射击变化的鲁棒性。我们为流行和最近的几个弹药分类器提供了余弦替代品，从而扩大了它们对现实环境的适用性。这些余弦模型一致地提高了射击力，超越先前的射击状态，并在一系列基准和架构上提供竞争精度，包括在非常低的射击方案中取得的显着增长。

translated by 谷歌翻译

Visual Prompt Tuning

Menglin Jia , Luming Tang , Bor-Chun Chen , Claire Cardie , Serge Belongie , Bharath Hariharan , Ser-Nam Lim

分类：计算机视觉

2022-03-23

当前的Modus Operandi在改编预训练的模型中涉及更新所有骨干参数，即，完整的微调。本文介绍了视觉及时调整（VPT），作为视觉中大规模变压器模型的全面微调的有效替代方案。VPT从最近有效地调整大型语言模型的最新进展中汲取灵感，在输入空间中仅引入了少量的可训练参数（少于模型参数），同时保持模型骨架冻结。通过对各种下游识别任务的广泛实验，我们表明VPT与其他参数有效调整协议相比获得了显着的性能增长。最重要的是，在许多情况下，VPT甚至在模型能力和培训数据量表的许多情况下都胜过全面的微调，同时降低了每任务的存储成本。

translated by 谷歌翻译

AugLiChem: Data Augmentation Library ofChemical Structures for Machine Learning

Rishikesh Magar , Yuyang Wang , Cooper Lorsung , Chen Liang , Hariharan Ramasubramanian , Peiyuan Li , Amir Barati Farimani

分类：机器学习

2021-11-30

机器学习（ML）已经证明了用于准确和结晶材料的准确性能预测的承诺。为了化学结构的高度精确的ML型号的化学结构属性预测，需要具有足够样品的数据集。然而，获得昂贵的化学性质的获得和充分数据可以是昂贵的令人昂贵的，这大大限制了ML模型的性能。通过计算机视觉和黑暗语言处理中数据增强的成功，我们开发了奥古里希姆：数据八级化图书馆化学结构。引入了弃头晶系统和分子的增强方法，其可以对基于指纹的ML模型和图形神经网络（GNNS）进行脱颖而出。我们表明，使用我们的增强策略意义地提高了ML模型的性能，特别是在使用GNNS时，我们开发的增强件在训练期间可以用作广告插件模块，并在用不同的GNN实施时证明了有效性。模型通过Theauglichem图书馆。基于Python的封装我们实现了EugliChem：用于化学结构的数据增强库，可公开获取：https：//github.com/baratilab/auglichem.1

translated by 谷歌翻译

Exploiting Playbacks in Unsupervised Domain Adaptation for 3D Object Detection

Yurong You , Carlos Andres Diaz-Ruiz , Yan Wang , Wei-Lun Chao , Bharath Hariharan , Mark Campbell , Kilian Q Weinberger

分类：计算机视觉

2021-03-26

自动驾驶汽车必须在3D中检测其他车辆和行人，以计划安全路线并避免碰撞。基于深度学习的最先进的3D对象探测器已显示出有希望的准确性，但容易过度拟合域特质，使它们在新环境中失败 - 如果自动驾驶汽车旨在自动操作，则是一个严重的问题。在本文中，我们提出了一种新颖的学习方法，该方法通过在目标域中的伪标记上微调检测器，从而大大减少这一差距，我们的方法在车辆停放时会根据先前记录的驾驶序列的重播而生成的差距。在这些重播中，随着时间的推移会跟踪对象，并且检测被插值和外推 - 至关重要的是利用未来的信息来捕获硬病例。我们在五个自动驾驶数据集上显示，对这些伪标签上的对象检测器进行微调大大减少了域间隙到新的驾驶环境，从而极大地提高了准确性和检测可靠性。

translated by 谷歌翻译

On the Efficacy of Knowledge Distillation

Jang Hyun Cho , Bharath Hariharan

分类：

2019-10-03

Figure 1. An illustration of standard knowledge distillation. Despite widespread use, an understanding of when the student can learn from the teacher is missing.

translated by 谷歌翻译